查看原文
其他

DB-Engines 2022 年度数据库排名和趋势解析

天舟 Bytebase 2023-01-28

正好数据库业界最权威的排名榜单 DB-Engines 前两天刚公布了 2022 年度数据库(https://db-engines.com/en/blog_post/103),我们就趁热一起来看看吧。

年度排名

Snowflake 继 2021 年后再次蝉联榜首,Google BigQuery 排第二,PostgreSQL 以微弱的劣势屈居第三。
DB-Engines 的排名完全是根据机器算法自动计算的,下图是各数据库的评分,可以看到 Snowflake 过去一年涨了 40.44,BigQuery 涨了 8.80,PostgreSQL 涨了 8.29,所以这三家位列三甲。

预期之中

老牌数据库的持续走低,尤其是三款老牌商业关系型数据库,Oracle, SQL Server, DB2 的降分幅度都很大。还看到前前前司的 FileMaker,也是继续下滑,已经 20 名开外了。

稍感意外

本来预期 2022 年的冠军应该是 Snowflake 或者 PostgreSQL,但没有想到 Snowflake 的优势那么巨大。也没有想到 Google BigQuery 会拿到第二的位置,本来猜测三甲里的另一个会是 SQLite 或者 MongoDB。另外也没有想到 Access 还有一点涨幅,Access 是和 FileMaker 同时代的数据库,也多少面临着 FileMaker 同样的问题。应该是在 Office 体系下,Access 的基本盘还是要扎实许多的,但估计明年就会被 SQLite 和 Snowflake 超越,掉出前 10 ,也永远不会再回来了。

大出所料

没想到 MongoDB 的降幅是所有数据库里最大的,21 年 MongoDB 还是年度数据库第三。就算大家逐渐从 NoSQL 的热度中清醒了过来,回归到关系型数据库。但整个 NoSQL 行业,2022 相比 2021 并没有里程碑事件发生,让我怀疑这块数据有点问题,所以这次我又去读了一下 DB-Engines 的打分规则。

排名规则

数据源还是相对客观的,但也有一些问题:
  1. 招聘数据源,没有 LinkedIn, Lever 这些。
  2. 社交媒体源不够丰富,虽然像 HackerNews 这些是 PostgreSQL, SQLite 的阵地,没有加进去是合理的。但是像 Reddit 是比较中立的,权重和 Stack Overflow 也不相上下。还有像一些开发者社区 dev.to, hashnode 也可以考虑。
  3. 各项指标的权重是黑盒。
招聘信息可以放在最高的权重,然后是 Stack Overflow 以及 Reddit。其他信息源都还是有比较明显的 Bias,会倾向于开源,上手方便,更有话题性的数据库(比如没人会谈论 Oracle, SQL Server 了,而聊 SQLite 就会显得很酷)。

趋势观察

当然 DB-Engines 排名的权威性,业界是认可的,能正确反映整体的趋势。DB-Engines 榜单正好到了第 10 年,我们来看看这 10 年里的优胜者
我们再看看 10 年来的趋势图 (log scale 展示)
可以清楚地看到老牌数据库都在走下坡路。2022 年 OLTP 这边,三大商业关系型数据库,Oracle, SQL Server, DB2 都在大幅掉分,而 MySQL,PostgreSQL 则都持续稳步增长。而在 OLAP 这边,Snowflake 的异军突起,也是对应着它在商业上的巨大成功;此外 Google BigQuery, Amazon Redshift 同样颇有建树;而老牌的 Teradata 则是走下坡路了。
数据库是软件领域的集大成者,如果以单一品类来论,数据库品类也占据着软件业里最大的商业阵地。整个数据库领域历史悠久,上下游玩家众多,50 多年的历史书写了一部交织技术和商业的史诗。如今我们正处在一轮新老交替的周期中点,有些趋势已然清晰:
  • 老一代商业数据库江河日下,比如 Oracle, DB2, SQL Server, Teradata。
  • 开源数据库步步为营,比如 MySQL, PostgreSQL。
  • 云原生数据库突飞猛进,比如 Snowflake, BigQuery, Redshift。
  • 单体数据库独树一帜,比如 SQLite, DuckDB。
但眼前也还有不少尘埃未定的话题:
  • 虽然云原生 OLAP 数据库基本大局已定,但是谁又能成为云原生时代 OLTP 战场的主宰?

  • 而云原生时代的 OLTP,究竟是纯粹的 OLTP,还是混合了 TP + AP 的 HTAP 数据库?

  • 即使国外云原生 OLAP 的市场已经相对饱和,但国内的市场还处于早期。究竟谁能脱颖而出,是更好的产品,更爽的服务,还是更铁的关系?

  • 单体数据库能走多远,有没有机会带来全面的范式转移,从中心化数据库走向去中心化数据库?

  • 随着老牌商业数据库的日渐式微,一起陪葬的还有整条工具链,以及相关从业人员。谁又能引领新一代数据库的工具链和相关从业人员?
这些问题,有些 3 年内就可见分晓,有些需要 5 年,还有一些可能需要 10 年,带入到下一个周期。
纷纷世事无穷尽,天数茫茫不可逃。历史的车轮滚滚向前,大家虽早已忘却了当年的 dBASE,FoxPro 们,但都在热切地寻找下一个的 Snowflake,Databricks。那就一起伴随着 DB-Engines 进入这个云时代数据库行业周期的下半个 10 年吧。(ง ˙o˙)ว


别再让你的工程师用 Navicat 连数据库了
喜喜喜|开源先锋 + 新锐技术先锋企业 + 最受开发者欢迎技术活动
年度精选 | 2022 年那些有趣的前端开源项目‍
【5000 字长文】从 S3 到 DataZone,AWS 用 16 年讲完一个数据的故事

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存